數(shù)據(jù)挖掘的奇跡之所以與機器學(xué)習(xí)息息相關(guān),是因為計算機學(xué)習(xí)算法,利用已有的數(shù)據(jù)來預(yù)測未知。大數(shù)據(jù)分析只是互聯(lián)網(wǎng)發(fā)展到現(xiàn)階段的一種表征或特征,沒有必要對其神話或保持敬畏。在以云計算為代表的技術(shù)創(chuàng)新背景下,這些原本難以收集和使用的數(shù)據(jù)變得容易被利用。那么大數(shù)據(jù)分析受哪些因素影響呢?
1.數(shù)據(jù)存放位置不正確:部分公司把數(shù)據(jù)發(fā)給外包商儲存以為就省心了,然而事實上這些數(shù)據(jù)到了外包商手里就會變成其他形式,最后轉(zhuǎn)化回來還需要花費不少工序,可以說是花錢買受罪也不為過。另外通常這些數(shù)據(jù)是宣傳造勢活動時期自身網(wǎng)站或者產(chǎn)品的相關(guān)數(shù)據(jù),通過結(jié)合日常運營數(shù)據(jù)我們就可以挖掘哪些活動促成了用戶轉(zhuǎn)化。要知道結(jié)合日常運營數(shù)據(jù)來分析用戶使用歷程的方式是非常重要的,但部分公司仍然將日常運營數(shù)據(jù)與活動數(shù)據(jù)分開來存放分析,其結(jié)果會嚴(yán)重妨礙公司對數(shù)據(jù)的正確理解和作出正確的決策。
2.忽略產(chǎn)品數(shù)據(jù)的分析:部分初創(chuàng)公司開發(fā)人員由于急于產(chǎn)品的開發(fā)往往會很容易忽略以下幾個數(shù)據(jù)分析:用戶對產(chǎn)品的具體使用細節(jié);產(chǎn)品在哪些場景怎么被使用;產(chǎn)品的哪些部分被使用;用戶二次使用產(chǎn)品的原因。一般來說這些問題如果沒有數(shù)據(jù)作為支撐開發(fā)人員對用戶作出的疑問都會難以回答,其造成的結(jié)果是用戶不再使用該產(chǎn)品,最終造成該項目產(chǎn)品開發(fā)的失敗。
3.框架設(shè)計不合理:一般來說一個好的數(shù)據(jù)分析框架在設(shè)計的開始都要考慮到要長期使用的需要。雖然說我們可以隨時調(diào)整框架,但隨著數(shù)據(jù)越積越多需要做調(diào)整的代價就越大,而且在做出調(diào)整后還需要同時記錄新舊兩套系統(tǒng)來確保數(shù)據(jù)不會丟失,時間久了不但大大降低工作效率還很容易出錯。因此在設(shè)計的開始我們最好把框架設(shè)計好,而其中一個簡單有效的方法就是我們把所有能獲取的數(shù)據(jù)放在同一個可延展的平臺,我們只要確認(rèn)這個平臺可以裝得下所有將來可能用到的數(shù)據(jù)且跨平臺也能運行起來就可以了。通常這樣的原始平臺能至少支撐一到兩年。
4.忽略成員對數(shù)據(jù)的理解:在實際的數(shù)據(jù)分析中,一部分公司以為把數(shù)據(jù)提交給Mixpanel,Kissmetrics、Google Analytics等進行分析就萬事大吉了,但事實上卻忽略了團隊中的成員能真正解讀這些數(shù)據(jù)的內(nèi)在含義,其結(jié)果只會導(dǎo)致產(chǎn)品團隊盲目的繞開用戶需求開發(fā)新產(chǎn)品,盡管有時能取得成功但也是對用戶的真正需求并不了解。因此我們做的是要經(jīng)常提醒團隊里面每一位成員多去理解這些數(shù)據(jù)并更多的基于數(shù)據(jù)來做出合理的決策。另外我們可以通過建立自助使用的數(shù)據(jù)平臺來解答開發(fā)人員在開發(fā)中的對數(shù)據(jù)不了解的疑惑,在很大程度上可以避免以上的情況發(fā)生。
5.沒有記錄足夠的數(shù)據(jù):如果我們只統(tǒng)計分析總項目數(shù)據(jù)而忽略對細分項目的數(shù)據(jù)的統(tǒng)計分析往往最后得出的結(jié)論是不準(zhǔn)確的。通常細分項目可以是每日甚至每個小時的變化明細等項目,如果我們只是粗放斷續(xù)的統(tǒng)計這些細分項目,我們就不能準(zhǔn)確的解讀出各種細微因素對于銷售或者用戶使用習(xí)慣的影響。由于數(shù)據(jù)儲存越來越便宜,所以如今同時做大量的分析其風(fēng)險大大降低,只要我們買足夠的空間就不會有系統(tǒng)當(dāng)機的風(fēng)險。因此對于初創(chuàng)企業(yè)應(yīng)盡可能多的記錄數(shù)據(jù),從而提升自己對用戶使用產(chǎn)品情況的了解。
6.頻繁的進行多次總結(jié):頻繁多次進行總結(jié)這個問題對于擁有大數(shù)據(jù)分析團隊的公司來說比較常見,然而過多的進行總結(jié)反而造成反效果,而其中多數(shù)過于簡單的總結(jié)是沒有起到任何實質(zhì)性作用的。從表面上看多次簡單的數(shù)據(jù)總結(jié)的確符合數(shù)據(jù)分析的流程,但我們不應(yīng)該基于簡單的的總結(jié)來做出決策,因為簡單的總結(jié)并不能真正反映問題的實質(zhì),相反我們更應(yīng)該關(guān)注極端值。租用服務(wù)器可咨詢夢飛云idc了解。